第6章 日本語DNN音声合成システムの実装
日本語音声合成のフロー(図6-1)
テキスト
→テキスト解析 #pyopenjtalk
→継続長モデル
→音響モデル
→ボコーダ #pyworld
レシピ=「実験を再現可能な形でまとめたシェルスクリプト群」(p.134)
#ESPnet でも使われる意味合い
学習用コーパス JSUT
basic5000
ProcessPoolExecutor
#hydra を使ったサンプルコード
stage 6
DNN
LSTM
疑問:DNNTTSはDNNを使っているのか、LSTMなのか
TODO:ttslearn.dnntts.gen を見る